کنترل ترافیک یک چهارراه راهنمایی رانندگی با استفاده از الگوریتم‌های یادگیری تقویتی (یادگیری-Q، سارسا و مسیرهای شایستگی)

Authors

  • امین نوری مربی، دانشکده برق و مهندسی پزشکی، دانشگاه صنعتی سجاد، مشهد، ایران
  • علیرضا عربی کارشناسی ارشد، دانشکده برق و مهندسی پزشکی، دانشگاه صنعتی سجاد، مشهد، ایران
Abstract:

یکیازمهمتریناهدافپژوهشدرحوزهحملو نقل،بهینهکردنجریان­های ترافیک است. امروزه با افزایش وسایل نقلیه به طور پیوسته،محدودیت در منابعارائهشدهتوسطزیرساخت­هایفعلیو ماهیت غیرخطی، پویا و تصادفی بودن جریان ترافیک، استفاده از روش‌های هوشمند در کنترل ترافیک به خصوص روش‌های حل مساله یادگیری تقویتی حائز اهمیت است. روش یادگیری تقویتی علاوه بر سادگی و نداشتن پیچیدگی محاسباتی، در عمل بی نیاز به مدل ریاضی محیط می‌باشد و خاصیت تطبیق پذیری با شرایط محیط و مقاوم بودن در برابر تغییرات محیطی را دارد. در این مقاله کنترل ترافیک یک تقاطع با سه روش از زیر روش‌های حل مساله یادگیری تقویتی (یادگیری-Q، سارسا و مسیرهای شایستگی) انجام شده است. نتایج شبیه‌سازی حاکی از آن است که مسیرهای شایستگی یک روش کنترلی بروزتر و بهینه‌تر نسبت به دو روش یادگیری-Q و سارسا که پیشتر در مقالات کنترل ترافیک مورد استفاده قرار گرفته است، می‌باشد.  

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

یادگیری تقویتی براساس معماری عملگر- نقاد در سیستم های چند عامله برای کنترل ترافیک

در نیمه دوم قرن گذشته اغلب جوامع شاهد شروع پدیده ای بنام ترافیک شهری در خود بوده اند که علت رخداد چنین پدیده ای عبور تعداد زیادی خودرو در زمان یکسان از یک زیر ساخت حمل و نقلی یکسان می باشد. پدیده ترافیک شهری دارای پیامدهای اقتصادی و محیط زیستی کاملاً شناخته شده ای از جمله آلودگی هوا، کاهش در سرعت، افزایش زمان سفر، افزایش مصرف سوخت و حتی افزایش تصادفات می باشد. یکی از راه های اقتصادی برای مدیریت ...

full text

توسعه سامانه‌های چند عامله و یادگیری تقویتی در کنترل هوشمند چراغ‌های راهنمایی

امروزه یکی از معضلات جوامع شهری، ازدحام و ترافیک خودروها در معابر شهری است که منجر به آسیب‌های مختلف اقتصادی، محیط زیستی و اجتماعی می‌شود. برای جلوگیری از این آسیب‌ها، نیاز به بهبود زیر ساخت‌های فعلی حمل و نقل در شهرهای بزرگ بیش از پیش احساس می‌شود. تمرکز مقاله حاضر بر روی کنترل هوشمند چراغ‌های راهنمایی به عنوان یکی از شاخه‌های سیستم‌های حمل و نقل هوشمند با استفاده از سامانه‌های چند عامله یادگی...

full text

توسعه کنترلر هوشمند چراغ‌های راهنمایی بر پایه یادگیری تقویتی حالت پیوسته در محیط ترافیکی میکروسکوپیک

افزایش روزافزون تعداد خودروها و در پی آن ترافیک‌های سنگین شهری چالش بزرگی را برای کنترل بهینه ترافیک شهری برای مهندسین ایجاد کرده است. روش مناسب برای کنترل بهینه ترافیک هرچه باشد یقیناً باید وفق پذیر بوده تا بتواند ترافیک شهری را که دارای طبیعت پویا، پیچیده و تغییرپذیر است را به‌خوبی مدیریت نماید. در این راستا تمرکز اصلی تحقیق حاضر کنترل هوشمند و توزیع یافته چراغ‌های راهنمایی بر پایه یادگیری تقو...

full text

یک روش ترکیبی جدید یادگیری تقویتی فازی

در این مقاله یک روش جدید یادگیری تقویتی پیوسته برای مسائل کنترل ارائه می‌شود. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات " با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی" نامیده شده است. در اینجا برای هر قاعده فازی تعدادی عمل نامزد در نظر گرفته می‌شود. هدف، یافتن مناسب‌ترین عمل نامزد (تالی) برای هر قاعده می‌باشد. با استفاده از بردار شدت آتش قواعد فازی و ...

full text

یادگیری تقویتی براساس معماری عملگر- نقاد در سیستم های چند عامله برای کنترل ترافیک

در نیمه دوم قرن گذشته اغلب جوامع شاهد شروع پدیده ای بنام ترافیک شهری در خود بوده اند که علت رخداد چنین پدیده ای عبور تعداد زیادی خودرو در زمان یکسان از یک زیر ساخت حمل و نقلی یکسان می باشد. پدیده ترافیک شهری دارای پیامدهای اقتصادی و محیط زیستی کاملاً شناخته شده ای از جمله آلودگی هوا، کاهش در سرعت، افزایش زمان سفر، افزایش مصرف سوخت و حتی افزایش تصادفات می باشد. یکی از راه های اقتصادی برای مدیریت ...

full text

تشخیص و کنترل استرس برمبنای سیگنال‌های مقاومت الکتریکی پوست و ضربان قلب با استفاده از یادگیری تقویتی

مقدمه: اختلالات اضطرابی شایع‌ترین وضعیت سلامت روانی است. از طریق تنظیم پاسخ به استرس می‌توان اضطراب را کنترل کرد. استرس به طور واضح بر سیستم اعصاب خودمختار اثر می‌گذارد و منجر به تعریق شدید و افزایش ضربان قلب می‌شود. روش‌های نوینی جهت شناسایی و کنترل استرس هنوز مورد نیاز است. مواد و روش‌ها: در این مقاله اضطراب از طریق یادگیری تقویتی کنترل شده است. برای اندازه‌گیری سطح استرس، مقاومت الکتریکی پوس...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 26  issue 94

pages  55- 68

publication date 2018-03-21

By following a journal you will be notified via email when a new issue of this journal is published.

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023